V2EX  ›  英汉词典
Enqueued related words: TF-IDF

Cosine Similarity

定义 Definition

余弦相似度:一种衡量两个向量在方向上有多相似的指标,等于它们夹角的余弦值。常用于文本相似度、信息检索与机器学习中;结果通常在 -1 到 1 之间(在向量分量非负的常见场景中多为 0 到 1),越接近 1 表示越相似。

例句 Examples

Cosine similarity measures how similar two vectors are.
余弦相似度用来衡量两个向量有多相似。

In document retrieval, we often compute cosine similarity between TF‑IDF vectors to rank results by relevance.
在文档检索中,我们常计算 TF‑IDF 向量之间的余弦相似度,以按相关性对结果排序。

发音 Pronunciation (IPA)

/ˈkoʊsaɪn sɪˈmɪlərɪti/

词源 Etymology

cosine 来自三角学术语,源于拉丁语背景下的数学用语发展而来,表示“余弦”;similarity 来自拉丁语 similis(相似的)。合起来直译为“用余弦来表示的相似性”,强调比较的是“方向/夹角”而不主要是“长度/大小”。

相关词 Related Words

文学与经典作品 Literary & Notable Works

  • Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, Introduction to Information Retrieval(信息检索教材中用于向量空间模型与文档相似度)
  • Daniel Jurafsky & James H. Martin, Speech and Language Processing(自然语言处理教材中常用于文本向量相似度与语义表示)
  • Salton, Wong, & Yang (1975), “A Vector Space Model for Automatic Indexing” (向量空间模型经典论文,相关背景中广泛使用余弦相似度思想)
  • Rajaraman & Ullman, Mining of Massive Datasets(在大规模数据相似度与近邻检索语境中讨论并使用)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2174 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 11:52 · PVG 19:52 · LAX 03:52 · JFK 06:52
♥ Do have faith in what you're doing.